2025-11-10 · Google TPU v7 Ironwood + Apollo OCS 大规模部署
摘要(Takeaway)
- Google TPU v7 Ironwood + Apollo OCS 完成 9216 chip SuperPod + 48 OCS 大规模落地,是 OCS 从 Spine 层进一步推进至 Scale-up 层(Pod 内立方体互联)的代际转折,标志着光路交换在 AI 算力集群骨干的地位被永久确立。
- MEMS 微镜阵列 OCS(Palomar)整机 ~108W vs 同等端口 EPS ~3000W,节电 ~95%;对速率/调制透明意味着 800G→1.6T→3.2T 演进时"换模块不换骨干",骨干代际折旧周期被拉长,光模块/光芯片成为代际升级的真正承担者。
- 2026 年 Google TPU 出货近 400 万颗 → 800G+ 光模块需求 >600 万只(TrendForce),叠加 800G+ 出货占比破 60%、1.6T 起量;A 股核心受益链条:中际旭创/新易盛(光模块)+ 凌云光/赛微电子(OCS 国产替代)+ 上游光芯片。
一、事件背景(Google OCS 历史与 Apollo 投入口径)
Apollo 是全球首个在数据中心规模量产部署的光路交换(OCS)系统,已经服役近十年,构成了 Google 数据中心的网络骨干。[Google 官方] [SemiAnalysis]
- 2025-11-06 至 11-10:Google 正式发布第七代 TPU "Ironwood",宣布于 2025 年 11 月底全面可用,并首次完整披露与 Apollo OCS 深度协同的 9216-chip SuperPod 架构。
[Google 官方][HPCwire] - 资本投入口径:市场流传"Apollo $3B 投入"说法,但权威渠道并未披露该确定数字;产业侧更一致的判断为 2026 年 Google OCS 网络侧支出约 $1.5–2.0B(与 BofA 预测的 \(1.74B 接近),\)3B 说法证据不足,建议采用区间情景。
[内资研报][外资研报] - 历史代际:过去 5 年 Google 已"累计部署数万台 136×144 端口 OCS",验证了 OCS 在生产环境的可靠性,2025 年的 TPU v7 是首次将 OCS 从 Spine 层进一步推到 Scale-up 层(Pod 内立方体互联)。
[SemiAnalysis]
二、TPU v7 Ironwood 关键参数
- 单片规格:FP8 稠密算力 4.6 PFLOPS,BF16 2.307 PFLOPS;HBM3e 192 GB;带宽 7.2–7.4 TB/s;ICI 双向带宽 1.2 Tb/s;3nm(N3P/N3E)。
[Google 官方][内资研报] - SuperPod 规模:9216 片(144 个 4×4×4 立方体),共享 HBM 1.77 PB;FP8 峰值 >42.5 EFLOPS;可在 DCNI 层经 300×300 大端口 OCS×256 台扩展至 147,456 片单逻辑域。
[The Register][内资研报] - TCO 优势:内部测算 TPU v7 相对 GB200/GB300 的单位有效算力成本低 30–44%;MFU≈15% 即可盈亏平衡,而 GB300 需要约 30%。
[内资研报][第三方报告] - 关于"v7 FP4 3.6 EF"的辨析:现有权威资料未给出 v7 的 FP4 口径;FP4 首次明确由 v8t/v8i 引入,应以 FP8 / SuperPod 42.5 EF 为准,避免代际配置混用。
[内资研报]
三、Apollo OCS 技术深度
3.1 MEMS 微镜阵列工作原理
- Apollo 内部代号 Palomar,核心是 MEMS 微镜封装:176 个独立可控 3D 微镜,因良率原因实际启用 136 个。
[SemiAnalysis][arXiv 2208.10041] - 每面微镜可被独立电控偏转,将入射光束精确映射至输出光纤束的目标端口;对速率/调制格式完全透明,意味着 800G→1.6T→3.2T 演进时"换模块不换骨干"。
[Google 官方] - 单台 OCS 实现非阻塞 136×136(早期)/ 300×300(DCNI 层新代)/ 600 端口(TPU v7 SuperPod 假设代际)的全光交换。
[内资研报][SemiAnalysis]
3.2 单 OCS ~100W vs 传统电交换 ~3000W(功耗 -95%)
- Palomar OCS 整机功耗约 108W,主要消耗在维持微镜位置;同等端口规模的 EPS(电交换)约 3000W,节电 ~95%。
[SemiAnalysis][DCD] - 物理意义不止节能:省去 O/E/O 多次转换与多级包转发缓存,链路时延趋近 0;硬件代际寿命显著长于电交换芯片(不绑定 SerDes 速率),折旧友好。
[内资研报] - Google 内部验证:脊层置换/直连架构下,吞吐 +30%、功耗 -40%、数据流完成时间 -10%、宕机时长 -50×、CapEx -30%。
[arXiv 2208.10041]
3.3 Palomar(当前代)已"广泛部署"
- 累计部署 OCS 数量已达"数万台"量级;TPU v4/v5/v6 已使用 OCS 做 Spine 替换,TPU v7 是首次将 OCS 推进到 Scale-up 内立方体互联的代际。
[SemiAnalysis][内资研报] - Palomar 系统采用前后向兼容设计:与 Google 数据中心当前及未来使用的任意波长/带宽兼容,意味着同一台 OCS 可服务从 800G 到 1.6T、3.2T 多代光模块的接入,资本开支边际效率显著。
[Google 官方]
3.4 OCS 路线图与技术路线分化
- MEMS 路线(Google/Lumentum):当前主流,端口密度高、插损可控、可靠性经过 10 年量产验证;瓶颈在 MEMS 微镜良率(Palomar 176 启用 136 即体现)。
- 液晶路线(Coherent):插损更低、切换速度更快,但端口扩展性弱于 MEMS;NVIDIA 投资 Lumentum 与 Coherent,意味着 OCS 双路线并存格局延续。
[内资研报] - 压电陶瓷 DLBS(Polatis/凌云光):低插损/低回波损耗优势明显,但端口扩展与装调复杂度限制大端口推广,适配差异化场景或冗余层应用。
[内资研报] - 硅光波导(iPronics 等):集成度高、潜力可观,但插损/串扰仍需演进,短期内难成主流。
[内资研报]
四、产业级影响
4.1 OCS 取代电交换(数据中心架构革命)
- 传统 Clos 架构以 EPS 为骨干,OCS 直接替换 Spine 层;TPU v7 进一步将 OCS 嵌入 Pod 内立方体互联,Scale-up 网络从铜缆+电交换走向"短铜+长光+全光交换"混合。
[内资研报] - 端口密度的两种版本并存(总端口共指向 ≈13,824):
- 版本 A:48 台 144×144 OCS(早期稳定口径)。
- 版本 B:48 台 600 端口 OCS(由 144 立方体×96 光口/立方体均摊推导)。
- 差异反映工程实现与代际产品并行演进,单机 BOM 与供应商组合存在分化。
[内资研报]
4.2 光路交换替代分组交换的趋势
- OCS 对速率/调制透明意味着网络骨干代际折旧周期被显著拉长,而光模块/光芯片层成为代际升级的真正承担者。
- 跨 Pod 扩展使用 300×300 大端口 OCS×256 台聚合,构成上层"光路直连"骨干,分组交换被压缩到末端。
[内资研报]
4.3 拉动 800G+ 光模块需求(近 4M TPU → 6M+ 模块)
- TrendForce 等多家机构测算:2026 年 Google TPU 出货 近 400 万颗,对应 800G+ 光模块需求超 600 万只。
[TrendForce][内资研报] - 全球 800G+ 光模块出货占比由 2024 年 19.5% → 2026 年 >60%;2025 年全球出货 2400 万只 → 2026 年跃升至接近 6300 万只(×2.6)。
[TrendForce] - 供给端:Innolight + Eoptolink 合计拿下 Google 80% 800G+ 订单;Lumentum 产能已排至 2028 年底,OCS 积压订单 >\(400M**,2026Q4 收入预计 **>\)100M。
[TrendForce][内资研报]
4.3.1 TPU v7 光模块需求分级配比(机架 → Pod → 集群)
| 网络层级 | 规模 | 光模块需求 | 配比 |
|---|---|---|---|
| 单机架 | TPU v7 单机架 | 96 个光模块 | 1:1.5(单 chip 配 1.5 个) |
| 单 Pod(SuperPod) | 9,216 chip | 13,824 个光模块 | 1:1.5(与机架保持一致) |
| 跨 Pod 扩展(DCN) | 147,456 TPU(147k 集群) | 约 29.5 万个光模块 | 1:2(跨 Pod DCN 链路引入额外光化层) |
关键解读:147k 集群相比单 Pod 配比从 1:1.5 升至 1:2(+33%),反映了 DCN 扩展层(跨 Pod)的光模块密度高于 Pod 内 OCS 互联——这是 Scale-up 全光化之外,Scale-across 跨集群互连的光模块拉动叠加层。
[内资研报]
4.4 Scale-up 网络的全光化
- TPU v7 在单 Pod 内通过 OCS 重构 X/Y/Z 三轴 3D Torus,是 Scale-up(节点内/Pod 内)走向全光化的标志性事件;NVIDIA NVLink 域当前仍以铜缆+电交换为主,分歧路径已经形成。
- Anthropic 已签约最高 100 万颗 TPU v7(2026 年起),与 Google 的 Apollo OCS 架构深度绑定。
[内资研报] - 工程意义:单 Pod 内 OCS 切片可动态重构(数十毫秒级完成),实现热点流量跨立方体回避与故障域 Pod 内自愈;这是传统铜缆+电交换无法实现的"软光网络"能力。
[arXiv 2208.10041]
4.5 上游光芯片/激光器的连锁拉动
- TrendForce:AI 数据中心激光器短缺已经形成,NVIDIA 战略锁定全球激光器供应链;Google 近 4M TPU 落地将进一步加剧上游 EML/VCSEL 紧张。
[TrendForce] - 上游光芯片国产化路径打开:源杰科技、长光华芯、武汉敏芯等 EML/VCSEL 供应商在 800G/1.6T 浪潮中受益,但Google 链条对可靠性要求极高,国产化突破节奏需谨慎跟踪。
五、对 A 股的传导
| 公司 | 影响方向 | 关键观察点 |
|---|---|---|
| 凌云光 (688400) | 压电 DLBS OCS / Polatis 代理(A 股 OCS 标杆之一) | 国内交付落地节奏;端口扩展能力突破;非 Google 客户拓展(国内云厂商) |
| 赛微电子 (300456) | MEMS 代工(瑞典 Silex),切入 MEMS-OCS 微镜阵列 | 北京亦庄产线 MEMS-OCS 量产验证;非 Google 客户首单兑现时间 |
| 中际旭创 (300308) | Google 800G/1.6T 光模块核心供应商(与 Innolight 协同) | TPU 配套份额;1.6T 放量节奏;硅光自给率 |
| 新易盛 (300502) | 800G+ 光模块二供(Eoptolink) | Google 订单兑现;产能爬坡 |
| 光迅科技 (002281) | OCS 模块/光器件跟进 | 国产 OCS 整机突破;上游器件供给 |
| 华工科技 (000988) | MEMS 工艺布局 | 跟进微镜阵列工艺路线 |
| 英唐智控 (300131) | 拟收购光隆集成切入 OCS 领域 | 收购落地与产品验证 |
现实约束:Google OCS 主供短期集中于 Lumentum(MEMS)+ Coherent(液晶),且客户对可靠性与算法控制栈耦合要求极高,新增主供短期难度大。本土厂商更现实的路径是上游关键器件、整机代工、非 Google 客户切入,逐步验证端口密度、插损、切换时间。
[内资研报]
五点五、风险与不确定性
- OCS 主供格局的"护城河":Lumentum/Coherent 与 Google 的算法控制栈深度耦合(OCS 调度依赖 SDN 与 TPU 编排算法),新进入者短期内难以撼动主供地位;A 股标的更现实的路径是"非 Google 客户"+"上游器件"。
- "$3B Apollo 投入"口径需谨慎:权威信源未确认;产业侧更可信的判断是 2026 年 OCS 网络侧支出 $1.5–2.0B,模型测算应采用区间情景而非单点假设。
[内资研报] - OCS 端口密度并行版本:48×144 vs 48×600 工程实现差异影响单机 BOM 与厂商组合,需持续跟踪 Google 下一轮技术发布或实物图核实。
[内资研报] - TPU 出货 4M 的兑现度:测算前提包括 TSMC N3P 产能、HBM3e 供给、Anthropic 等大客户落地节奏;任一环节延期都将影响下游光模块/OCS 弹性。
- 代际跳跃风险:CPO(共封装光学)与 OCS 是互补还是替代关系存在分歧;若 CPO 在 2027-2028 年快速放量,OCS 的"骨干价值"可能被部分稀释。
[内资研报]
六、关键跟踪指标
- Google 2026 TPU 实际出货量:是否达到/接近 400 万颗(决定光模块/OCS 弹性)。
- 800G+ 光模块出货占比:2026 年是否突破 60%(TrendForce 预测);1.6T 占比起量节奏。
- Lumentum OCS 营收:2026Q4 是否兑现 >$100M;积压订单是否突破 $500M(前为 $400M)。
- A 股 OCS 玩家关键节点:
- 赛微电子 MEMS-OCS 北京亦庄产线试产 → 量产时间表
- 凌云光 DLBS OCS 国内云厂商首单(百度/阿里/腾讯)
- 英唐智控 光隆集成收购完成与整合进度
- OCS 端口密度版本:48×144 vs 48×600 哪种成为 Google 主流(决定单机 BOM 与厂商组合)。
- TPU v8/v8i 节奏:FP4 引入是否进一步提升单 Pod 算力密度(拉动单 Pod 光端口数)。
七、横向比较:与 NVIDIA Scale-up 路线的分歧
| 维度 | Google TPU v7 + Apollo OCS | NVIDIA GB200/GB300 NVLink |
|---|---|---|
| Scale-up 介质 | 光(OCS + 光模块)+ 短铜混合 | 主要为铜缆 + 电交换(NVL72/NVL576) |
| 单 Pod 规模 | 9216 chip / 1.77 PB HBM | NVL72: 72 chip;NVL576 路线规划中 |
| 网络代际折旧 | OCS 骨干长寿命(不绑定 SerDes 速率) | 电交换芯片绑代际,折旧压力大 |
| 单位 TCO(内部口径) | 较 GB200/GB300 低 30–44% | 基线 |
| 光模块依赖度 | 极高(Pod 内+Pod 间均光化) | 较低(铜缆为主,跨 Pod 光化) |
路线分歧核心:Google 押注"全光骨干 + 透明速率演进",NVIDIA 押注"高密度铜+电交换 + CPO 兜底";A 股光模块/OCS 板块的最大边际利好来自 Google 路线的成功。
[内资研报][外资研报]
八、来源
[Google 官方]Google Cloud Blog: "Inside the Ironwood TPU codesigned AI stack" (2025-11);"3 things to know about Ironwood, Google's latest TPU";TPU7x Documentation[SemiAnalysis]"Google OCS Apollo: The >$3 Billion Game-Changer in Datacenter Networking" (2023-03);"Google TPUv7: The 900lb Gorilla In the Room" (2025-11)[arXiv 2208.10041]Mission Apollo: Landing Optical Circuit Switching at Datacenter Scale[HPCwire]"Google Aims to Flip the Script on AI Inference with New Ironwood TPUs" (2025-11-10)[The Register]"TPU v7, Google's answer to Nvidia's Blackwell is nearly here" (2025-11-06)[DCD]Datacenter Dynamics: "Mission Apollo: Behind Google's optical circuit switching revolution"[TrendForce]"Google's High-Speed Interconnect Architecture to Push 800G+ Optical Transceiver Share Past 60% by 2026" (2026-02-10);"Google Unveils 7th-Gen TPU Ironwood with 9,216-Chip Superpod" (2025-11-07)[内资研报]通信行业投资策略:谷歌 TPU v7 与 OCS 光交换,架构革新与产业链机遇 (2026-02-13);通信行业专题报告:数据中心互联技术专题 (2026-02-26);互联网行业谷歌链专题:AI 全栈式创新 (2025-11-06);中际旭创深度研究 (2026-04-22);英唐智控首次覆盖报告 (2026-02-26);凌云光业绩解读会路演纪要 (2026-04-29)[外资研报]US Semiconductors and Hardware: Weekly Investor Pulse: Google TPUs & TSMC Technology Roadmap (2026-04-24)[第三方报告]2026 人工智能行业发展蓝皮书 (2026-04-26);面向大规模智算集群场景的光互连技术白皮书 (2025-10-24)